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摘要 : GeBP 转录 因子 调控 植物 表皮 毛 的 生长 发 育 ， 并 且 参 与 控制 植物 叶片 的 发 育 。 利 用 生 
物 信息 学 方法 ， 在 大 豆 全 基因 组 范围 内 搜索 GeBP 基因 家 族 ， 并 从 氨基 酸 理化 性 质 、 基 因 结 
构 、 染 色 体 的 物理 分 布 、 系 统 进化 、 序 列 比 对 、 功 能 结构 域 、 组 织 表 达 情 况 等 基本 特征 方面 
对 GmGeBP 基因 家 族 进行 分 析 。 共 获得 9 个 GmGeBP 转录 因子 家 族 基因 成 员 ， 其 中 仅 2 个 
基因 含有 内 含 子 ， 而 且 都 只 有 1 个 内 含 子 ， 表 明 该 家 族 成 员 基 因 构 造 比 较 简 单 但 稳定 。 
GmGeBP 编码 的 蛋白 分 子 量 为 39.65 一 49.24kD,， 理论 等 电 点 为 4.65 一 9.08; 这 些 成 员 基 本 上 
都 是 酸性 氨基 酸 ， 属 于 亲 水 性 、 不 稳定 蛋白 。 这 9 个 基因 不 均匀 的 分 布 于 7 条 染色 体 上 ，10 
和 20 号 染色 体 上 分 别 分 布 2 个 GeBP ÆA, 3, 5, 13, 15, 19 号 染色 体 上 各 分 布 1 个 
基因 。 系 统 进 化 分 析 表 明 ， 大 豆 与 拟 南 芥 对 应 的 GeBP 成 员 亲 缘 关 系 较 近 ， 分 别 聚 类 到 4 个 
分 支 ， 而 与 水 稳 的 距离 较 远 。 结 构 域 分 析 表 明 ，9 个 GmGeBP 成 员 都 包含 DUF573 结构 域 ， 
E 测 该 部 分 在 GeBP 转录 因子 中 很 可 能 是 与 识 标 基因 顺 式 作用 元 件 互 作 的 结构 域 。 通过 分 析 
XX GmGeBP 转录 因子 家 族 基 因 的 组 织 表 达 ， 发 现 不 同 基 因 的 在 大 豆 不 同 组 织 的 表达 量 不 
同 , 具有 一 定 的 特异 性 。 该 文 对 大 豆 GeBP 转录 因子 基因 家 族 的 分 析 和 鉴定 为 进一步 研究 大 
豆 表皮 毛发 育 的 分 子 作 用 提供 了 理论 基础 。 
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Bioinformatics analysis of GeBP transcription factor gene 
family in soybean 
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Abstract: It has been clarified that GeBP transcription factor regulates the growth and 
development of plant epidermal hair and participates in the control of plant leaf development. The 
bioinformatics methods were used to identify the GeBP gene family in the whole soybean genome, 
and from physicochemical properties of amino acids, as well as gene structure, physical 
distribution of chromosomes, phylogenetic tree, and multiple sequence comparison, the functional 
domain, tissues expression and other basic characteristics of GmGeBP gene family were analyzed. 
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A total of nine members of GmGeBP transcription factor family were identified, of which only 
two genes contained introns and all had only one intron, indicating that the gene structure of the 
family members was relatively simple but stable. The molecular weight of GmGeBPs is 
39.65-49.24 kD, and the theoretical isoelectric point is 4.65-9.08; these members are basically 
acidic amino acids, which are hydrophilic and unstable proteins.The chromosome physical 
distribution showed that 9 genes were unevenly distributed on 7 chromosomes, 2 GeBP genes on 
chromosome 10 and 20, respectively, and 1 gene on chromosome 3, 5, 13, 15 and 19 respectively. 
The phylogenetic analysis showed that GeBP members of soybean and Arabidopsis thaliana were 
closely related, clustered into four branches respectively, but far away from Oryza sativa. The 
analysis of domains showed that all the nine GmGeBP members contained DUF573 domain, 
which was probably the domain interacting with cis-acting elements of target genes in GeBP 
transcription factors. By analyzing the expression of GmGeBP transcription factor family, we 
found that the expression of different genes in different tissues is different, with a certain 
specificity. The analysis and identification of GmGeBP transcription factor gene family provided a 


theoretical basis for further studying the molecular role of soybean epidermal development. 
Key words: Glycin max, GeBP transcription factor, bioinformatics, tissue expression 


表皮 毛 广泛 分 布 于 陆地 植物 的 叶片 、 茎 秆 以 及 花 莹 等 地 上 部 器 官 的 表面 , 是 植物 表皮 细 
胞 分 化 形成 的 一 种 特殊 的 细胞 形态 。 表 皮毛 是 植物 的 第 一 道 保护 屏障 , 通过 调节 水 分 的 蒸腾 
作用 , 减缓 叶片 的 热 负 荷 , 增强 对 冷冻 或 紫外 线 的 耐 受 性 , 增强 植物 抵御 昆虫 捕食 的 防御 能 
JJ. 转录 因子 是 生物 体 生长 发 育 过 程 中 一 类 重要 的 调节 因子 , 高 等 生物 体 因 其 机 体 的 复杂 性 
需要 更 多 的 转录 因子 参与 。GeBP(GLABROUS1 enhancer binding protein) 是 一 类 植物 特有 的 
转录 因子 ， 拟 南 芥 GeBP 可 以 通过 与 GL1(GLABROUS7) 基 因 的 互 作 调控 来 控制 表皮 毛 的 发 
生 ( 普 利 等 ，2003)。GeBP 包含 中 央 DNA HAK, bZIP 转录 因子 保守 域 和 C. 末端 保守 区 ， 
然而 这 个 bZIP 转录 因子 保守 域 有 别 于 经 典 的 bZIP 转录 因子 保守 域 , 且 真 正 发 挥 功能 的 是 中 
X DNA 结合 区 和 C 末端 保守 区 ， 所 以 GeBP 是 植物 中 一 类 新 的 转录 因子 蛋白 (Curaba et al., 
2003; Chevalier et al., 2008)。 当 前 只 在 拟 南 芥 Cdrapiadopsis thaliana). 7Kf&(Oryza sativa). 3& 
Ji(Solanum lycopersicum)8-&] (Phyllostachys edulis) 中 有 关于 GeBP 转录 因子 基因 家 族 的 报 
道 ， 这 四 种 植物 GeBP 基因 家 族 成 员 分 别 是 22 ^ (Chevalier et al., 2008). 15 4^ (88, 2013). 
10 个 ( 陈 凯 等 , 2019) 和 16 个 ( 单 雪 萌 等 , 2020), 关于 GeBP 转录 因子 具体 功能 的 报道 还 很 少 。 
在 植物 中 ， 转 录 因 子 通常 参与 激素 途径 与 激素 互 作 来 调控 植物 的 发 育 。GeBP 和 蛋白 可 以 
与 GLI 基因 顺 式 调控 元 件 结合 调控 该 基因 的 转录 ，CZ7 基因 属于 mb 基因 ， 参 与 表皮 细胞 
决定 且 被 赤 霉 素 和 细胞 分 裂 素 调 控 (Gan et al., 2007); GeBP 基因 的 表达 受到 KNOX 家 族 转录 
因子 BP(BREVIPEDICELLUS) 基 因 的 正 向 调控 (Curaba et al., 2004), KNOX 在 葵 端 分 生 组 织 
正 向 调控 细胞 分 裂 素 途 径 (Jasinski et al., 2005)， 由 此 推测 GeBP 可 能 通过 调控 赤 霉 素 和 细胞 
分 裂 素 途径 来 控制 表皮 毛 的 发 生 (Chevalier et al., 2008). 

Ray et al.(2011) 研 究 发 现 CoHo.. CoCo.. CH. LIM, PHD, WRKY, ZF-HD 和 ZIM 等 锌 
指 类 转录 因子 成 员 ， 以 及 GeBP、jumonji、MBF1 和 ULT 等 转录 因子 家 族 在 缺 水 条 件 下 出 现 
表达 差异 。MBF1，jumonji，ULT 和 GeBP 这 四 类 转录 因子 家 族 一 般 认 为 主要 参与 植物 发 育 
过 程 和 植物 激素 反应 (Curaba et al., 2003; Noh et al., 2004; Kenichi et al., 2004; Carles et al., 
2005; Chevalier et al., 2008)， 它 们 通常 不 参与 胁迫 条 件 下 的 应 激 反应 性 ， 然 而 在 水 分 亏 缺 肋 
迫 条 件 下 都 表现 为 表达 上 调 , 表明 GeBP 等 转录 因子 在 植物 对 干旱 逆境 的 反应 中 发 挥 一 定 的 
作用 。 新 近 研 究 发 现 ，LiGeBP 和 LiMYB、LibZIP、LieBp-2、LiERF 等 五 类 转录 因子 可 能 
Je UK erp Bois c BER GR, LiGeBP 可 能 参与 控制 草 衣 草 中 单 凋 合 酶 的 合成 (Sarker et al., 
2019)。 

Xi (Glycin max) 的 起 源 在 中 国 ， 随 着 人 类 活动 范围 的 扩大 已 经 广泛 种 植 于 世界 各 地 ， 
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大 豆 早 就 成 为 世界 性 的 重要 经 济 作物 , 它 为 我 们 提供 了 主要 的 植物 油 和 植物 蛋白 , 同时 也 是 
动物 饲料 蛋白 质 的 主要 来 源 。 大 豆 表皮 毛 同 其 它 植 物 的 一 样 也 是 典型 的 单 细胞 结构 , 不 存在 
分 支 。 研 究 证 实 ， 大 豆 表皮 毛 的 密度 同 抗 虫 和 抗旱 等 性 状 关系 密切 ， 但 是 关于 大 豆 表 皮毛 发 
育 的 分 子 基础 研究 还 鲜 有 报道 。 大 豆 基 因 组 测序 工作 已 于 2010 年 完成 并 公布 (Schmutz et al., 
2010)， 这 为 大 豆 相 关 基 因 家 族 及 功能 基因 在 基因 组 水 平 上 的 探索 研究 提供 了 可 能 。 大 豆 
WRKY、ERF 、Dof 等 转录 因子 基因 家 族 在 全 基因 组 层面 的 分 析 报 道 也 越 来 越 多 (Yu et al., 
2016; Song et al., 2016; 翟 莹 等 ，2016; Æ$, 2019; 刘 蓓 等 ，2020)， 但 是 还 未 见 有 关 
于 大 豆 GeBP 转录 因子 基因 家 族 的 研究 报道 。 本 研究 通过 生物 信息 学 的 方法 ， 从 基因 的 核 苔 
酸 序列 长 度 和 和 氨基酸 序列 的 基本 理化 性 质 、 基 因 在 染色 体 的 物理 定位 、 綦 因 结 构 、 系 统 进化 
树 、 序 列 对 比 、 功 能 结构 域 分 布 、 基 因 在 不 同 组 织 的 表达 情况 等 基本 特征 方面 对 大 豆 GeBP 
转录 因子 家 族 进 行 全 面 预 测 和 分 析 , 为 进一步 深入 探究 大 豆 GeBP 转录 因子 家 族 基因 的 生理 
生化 功能 提供 理论 依据 。 
1 材料 与 方法 
1.1 材料 

从 植物 转录 因子 数据 库 PlantTFDB(http:/planttfdb.cbi.pku.edu.cn/) 搜 索 获 得 拟 南 芥 
(Arabidopsis thaliana). 7Kf&(Oryza sativ UK © (Glycine max) 这 3 个 物种 GeBP 转录 因子 基 
因 家 族 共 40 个 成 员 的 基因 座位 置信 息 ， 然 后 从 IJGI 的 Phytozome 
(https:/phytozome.jgi.doe.gov/pz/portal.html) 搜 索 获 得 水 稻 、 大 豆 和 拟 南 芥 的 GeBP 转录 因子 
基因 的 编码 区 及 CDS 序列 和 氨基 酸 序 列 ， 同 时 获得 大 豆 GeBP 转录 因子 基因 家 族 在 不 同 组 
4 织 部 位 表达 的 FPKM (Fragments Per Kilobase of transcript per Million fragments mapped) 值 。 
LO) 1.2 方法 
- 1.2.1 KE GeBP 基因 家 族 基 本 信息 获取 
NI 利用 DNASTAR Lasergene 软件 中 的 EditSeq 分 析 所 获得 大 豆 GeBP 基因 的 编码 区 和 CDS 


d 序列 长 度 , 用 Expasy Chttps://web.expasy.org/protparam/) 在 线 分 析 大 豆 GeBP 的 氨基 酸 序 列 ， 
pe 获得 氨基 酸 残 基 长 度 、 分 子 质量 、 理 论 等 电 点 、 不 稳定 系数 、 亲 水 性 指数 等 基因 基本 信息 。 
:= 1.2.2 KE GeBP 基因 染色 体 定 位 
p KE GeBP 基因 在 染色 体 的 位 置信 息 来 自 Phytozome 大 豆 基因 组 数据 库 ， 从 NCBI 的 
Genome Data Viewer (https://www.ncbi.nlm.nih.gov/genome/gdv/) 获得 大 豆 每 条 染色 体 的 总 
r= 长 度 ， 根 据 这 些 信息 用 maplnspect 软件 绘制 大 豆 GeBP 基因 在 染色 体 上 的 物理 分 布 图 。 
O 1.2.3 KE GeBP 基因 的 生物 信息 学 分 析 
用 GSDS9(Gene Structure Dispely Server, http://gsds.cbi.pku.edu.cn/)(Hu et al., 2015) E 2E 
绘制 大 豆 和 拟 南 芥 GeBP 基因 结构 图 用 MEGA7 软件 采用 邻接 法 NJ(Neighbor-Joining) 构 
建 大豆 、 拟 南 芥 和 水 稻 GeBP 基因 家 族 氨 基 酸 序列 的 系统 进化 树 (Kumar et al., 2018), 校 验 参 
Zi Bootstrap=1000; 运用 DNAMAN 软件 对 大 豆 GeBP 基因 家 族 的 氨基 酸 序 列 进行 多 重 序列 
LEX]; Hl Lasergene 软件 的 MegAlign 分 析 大 豆 GeBP 基因 家 族 氨基 酸 序列 间 的 相似 性 ， 用 
Pfam 32.0(Chttp:/pfam.xfam.org/) 在 线 搜 寻 鉴 定 大 豆 GeBP 蛋白 序列 功能 结构 域 (Domain) 的 存 
在 情况 。 
1.2.4 大 豆 GeBP 基因 在 不 同 组 织 的 表达 
用 Heml 软件 (http://hemi.biocuckoo.org/down.php) 绘 制 大 豆 GeBP 基因 在 花 (Flower)、 叶 
(Leaves)、 根 冶 (Nodules)、 莱 果 (Pod)、 根 (Root)、 根 毛 (Root Hair). PEF (Seeds ZRI EH 
织 (Shoot Apical Meristem)、 茎 (Stem) 等 9 个 不 同 组 织 的 表达 热 图 。 


2 结果 与 分 析 


2.1 Xi. GeBP 基因 的 基本 信息 及 染色 体 定位 
通过 在 植物 转录 因子 数据 库 PlantTFDB 搜索 获得 大 豆 转 录 因 子 GeBP 基因 成 员 , 共 获 得 


基因 


名 称 


Gene name 


GmGeBP1 
GmGeBP2 
GmGeBP3 
GmGeBP4 
GmGeBP5 
GmGeBP6 
GmGeBP7 
二 GmGeBP8 
^ GmGeBP9 


9 个 大 豆 无 表皮 毛 增强 子 结合 蛋 


豆 基 因 


Expasy 在 线 分 析 氢 基 酸 序列 获 和 


蛋白 基因 ， 分 别 命名 为 GmGeBP1-9( 表 1)。 在 Phytozome 大 
组 数据 库 搜索 获得 这 9 个 基因 所 对 应 的 编码 区 序列 、CDS 序列 、 氨 基 酸 序列 ， 并 用 
寻 蛋 白质 序列 基本 的 理化 性 质 信息 。 


表 1 大 豆 GeBP 基因 家 族 成 员 基本 信息 
Tab.1 Basic information of GeBP gene family in Glycine max 
编码 区 长 度 
CDS 长 度 “和 蛋白质 长 度 理论 等 电 点 ”不 稳定 系数 
其 因 座 ID Length of 分 子 质量 
Length of Protein Isoelectric Instability 
Locus ID coding region MW/kD 
" CDS /bp Length/aa point/pI Index 
p 
Glyma.03G245200 1218 1218 40 44.61 5.00 60.84 
Glyma.05G088300 1294 1164 387 43.23 9.08 46.87 
Glyma.10G160000 1119 1119 372 41.29 4.75 53.99 
Glyma.10G160100 1160 1128 375 43.15 5.20 55.57 
Glyma.13G251000 1347 1347 448 49.24 5.26 65.50 
Glyma.15G063300 1314 1314 437 48.35 5.48 69.85 
Glyma.19G242600 1215 1215 404 44.74 4.81 56.93 
Glyma.20G228300 1074 1074 357 41.06 4.93 63.02 
Glyma.20G228500 1062 1062 353 39.65 4.65 67.12 


如 表 1 所 示 ，GmGeBP 转录 
染色 体 上 有 GmGeBP3 和 GmGeBP4 两 个 GeBP 基因 
GmGeBP9 两 个 GeBP 基因 。 
码 区 长 度 和 CDS 长度 一 样 ， 表 明 这 些 GeBP 基 
的 纺 
含 内 含 子 的 。 大 豆 GeBP 基因 
员 和 蛋白 质 长 度 在 300—400. AER 
间 。 其 中 ，GmGeBP5 的 氨基 酸 长 度 


GmGeBP4 这 两 个 基因 
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色 体 各 有 一 个 GeBP 


因子 家 族 的 9 个 成 员 分 别 4 分 布 在 7 
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条 染色 体 上 ， 其 
, 20 号 染色 体 上 有 GmGeBP8 和 
。 有 7 个 大 豆 GeBP 基 
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结构 中 不 含 
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, 说 明 这 两 个 基 
长 度 在 353 一 448 个 氨基 酸 之 间 ， 
ez. 有 4 个 家 族 成 员 的 长 度 在 400 一 500 个 氨基 酸 之 


只 有 GmGeBP2 和 
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结构 上 是 包 


GmGeBP9 的 氨基 酸 长 度 最 短 (353 aa)， 其 分 子 质量 也 是 最 小 ， 
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点 也 存在 一 定 的 差异 ， 
等 电 点 为 9.08， 是 碱 性 氨基 酸 ， 
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大 于 40, 则 表明 是 不 稳定 
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定 系数 是 月 
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等 电 点 值 


所 有 的 不 稳定 系数 都 大 于 40， 说 明 这 些 


水 性 蛋 
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白 ， 杀 水 性 指数 知 小 于 
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其 余 8 个 GeB 


其 中 5 个 成 


(448 aa)， 其 分 子 质 量 也 是 最 大 ， 为 49.24 kD; 
73 39.65 kD. 
在 4.65—9.08 之 间 变 化 ， 


这 9 个 GeBP 
只 有 


理论 
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HE 
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的 则 为 杀 水 性 和 蛋 
蛋白 的 杀 水 性 指数 都 小 于 -0.3， 说 明 这 些 和 蛋白 都 是 亲 水 性 蛋白。 
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图 1 GmGeBP 基因 的 染色 体 物理 定位 
Fig.l Chromosome physical location of GmGeBP genes 

大 豆 共有 20 对 40 条 染色 体 ， 基 因 在 染色 体 上 的 分 布 用 1 号 -20 号 染色 体 来 表示 。 大 豆 
GeBP 基因 家 族 共有 9 个 成 员 ， 不 均匀 的 分 布 在 Chr3. Chr5, Chrl0. Chr13, Chr15, Chr19, 
Chr20 等 7 条 染色 体 上 。 其 中 在 Chr10 和 Chr20 上 各 分 布 有 两 个 GeBP 基因 ， 从 后 面 的 序列 
一 致 性 及 进化 树 分 析 的 结果 来 看 ， 尽 管 GmGeBP3 和 GmGeBP4. GmGeBP8 和 GnGeBP9 这 
两 组 基因 在 物理 位 置 上 距离 很 近 ， 但 是 它们 之 间 在 进化 上 不 存在 复制 关系 ， 是 独立 进化 的 。 
在 图 1 可 以 发 现 ,这些 基 因 在 染色 体 上 相对 独立 存在 ,在 染色 体 上 没有 以 基因 艇 的 存在 形式 。 
2.2 GeBP 基因 结构 分 析 

利用 大 豆 和 拟 南 芥 GeBP 基因 家 族 成 员 的 编码 区 序列 和 CDS. 序列 通过 GSDS 在 线 构建 
基因 结构 图 , 用 图 像 直 观 的 来 研究 GeBP 基因 的 结构 情况 。 如 图 2 所 示 , 大 豆 9 条 GeBP d 
因 有 7 个 不 包含 内 含 子 , 另外 两 个 有 内 含 子 的 基因 也 分 别 包含 一 个 内 含 子 。 在 进行 基因 克隆 
研究 基因 功能 的 时 候 , 没 有 内 含 子 的 基因 可 以 直接 通过 提取 的 DNA 为 模板 来 获得 基因 序列 ， 
而 没有 必要 提取 RNA 之 后 再 反 转 录 作 为 扩 增 模板 。 


外 显 子 Exon | 一 一 一 WEFT Itron 
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S 5' 
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BEREIK Cp) 
The length of nucleotide sequence (bp) 
图 2 KE GeBP 基因 结构 图 
Fig.2 Gene structure map of soybean GeBP genes 

再 来 分 析 拟 南 芥 GeBP 基因 家 族 基 因 结 构 , 研究 发 现 拟 南 芥 22 个 GeBP 基因 有 16 个 成 
员 也 没有 内 含 子 ， 有 6 个 基因 包含 内 含 子 ， 其 中 有 4 个 基因 均 只 含有 1 个 内 含 子 ，1 个 基因 
含有 3 个 内 含 子 ，1 个 基因 含有 4 个 内 含 子 ( 图 3)。 总 体 来 看 ，GeBP 基因 的 基因 结构 在 不 同 
植物 上 都 表现 的 比较 稳定 , 因为 没有 内 含 子 存在 或 存在 很 少 的 内 含 子 , 在 转录 时 不 易 形成 可 
变 剪接 体 。 
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Fig.3 GeBP genes structure map of Arabidopsis thaliana 
2.3 构建 GeBP 基因 家 族 进化 树 


11 个 水 稳 GeBP 基因 、9 个 大 豆 GeB 


MEGA 7 的 邻接 法 构建 这 40 个 GeBP 蛋白 序列 的 进化 树 。 


形 处 理 上 ， 将 大 豆 基 因 标 注 黑 色 圆 形 


Seb 


基因 。 在 


基因 数量 最 


第 一 个 分 支 ， 


上 图 4 所 示 ， 进 化 树 可 以 分 为 4 个 大 的 分 支 ， 分 别 含有 14 个 
三 个 物种 的 基因 都 有 ; 


步 了 解 GeBP 基因 家 族 系 统 进化 关系 , 本 研究 选取 20 个 拟 南 芥 GeBP 基因 、 
等 3 个 植物 的 GeBP 基因 进行 比 对 分 析 ， 利 用 
其 中 ， 为 了 更 加 方便 辨识 ， 在 图 


P 基因 


Vae F 


.10 个 .6 个 和 1 


10 个 GeBP 


第 二 个 分 支 只 


最 少 ， 但 是 包含 有 拟 南 芥 和 大 豆 的 基因 ， 


MA 


源 拟 南 介 的 基因 。 
关系 上 要 更 近 一 些 。 


个 基因 


J 见 ， 因 大 豆 和 拟 南 芥 同 属 双 子叶 植物 的 缘故 ，i 


的 进化 关系 来 看 ， 相 


同 物 种 间 的 基因 进化 关系 最 近 


VL AUDI 的 基因 
第 四 个 分 支 以 水 稻 基 因为 主 , 仅 有 一 个 来 


第 三 个 分 支 


这 两 个 物种 的 基因 在 进化 


， 如 大 豆 的 GmGeBPI 


和 GnGeBP7, GmGeBP3 和 GnGeBP9, GmGeBP4 fll GmGeBP8, 拟 南 芥 的 AtGeBP10 和 
AtGeBP21, AtGeBP3 fll AtGeBP6, AtGeBP8 和 AtGeBP15， 水 稳 的 OsGeBP6 和 OsGeBP9, 


OsGeBP3 和 OsGeBP5, OsGeBP4 和 OsGeBP8 等 。 表明 GeBP 基因 在 物 
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进行 序列 比 对 的 目的 是 从 核酸 以 及 氨基 酸 的 层次 来 分 析 序 列 的 相同 点 和 不 同 点 , 进 
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图 4 AtGeBP、GmGeBP 和 OsGeBP 系统 进化 树 
Fig.4 The phylogenetic tree of AtGeBP. GmGeBP and OsGeBP proteins 


而 推 


测 它们 的 结构 、 功 能 以 及 进化 上 的 联系 。 大 豆 GeBP 家 族 成 员 含 有 大 约 131 个 氨基 酸 组 成 


GeBP 4& 


白 的 氨基 酸 序 列 的 一 致 性 比较 低 (结果 没有 展示 )。 大 豆 的 GeBP 5 


的 功能 结构 域 ， 功 能 结构 域 仿 有 大 量 的 碱 性 氨基 酸 :， 精 氨 酸 (R) 和 赖 氨 酸 K)。 不 同 物种 间 
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序列 比 对 的 结果 表明 ， 大 豆 本 身 的 GeBP 蛋白质 氨 基 酸 序列 的 一 致 性 也 不 是 很 高 , 所 有 成 员 


N 


共有 的 氨基 酸 序列 非常 少 (图 5)。 


GmGeBP1 FREEDMD....DDDDESQ...EDEEYEEDDD. 33 
GmGeBP2 SSSEEASSQEEDDDDQPPTLPLASANPHPKPS 94 
GmGeBP3 ESDLNDAVFPEEDLD....DDDDD..... ETPEDEED... 29 
GmGeBP4 . STMLSRLVSWILSPSSS.....EEEEEILDIIKDNDINHENDO 63 
GmGeBPS ^ MAQKOKLRPSPLDEPPTASSSDSEEEEPQOQOPSSQKNKEEEDEEVSSGEEEEEDEEEEEAASSEEEEEDEDLPPPPVSKNPPPPP.ANPQPOHSSSESETESGS  — 104 
GmGeBP6 ASSEEEEDENLPPPPISKNPPPPPPSNPQPOPTSSESETESGS 96 
GmGeBP7 OQHDAVFREEDMD. ...DDDDESQ. . . EDGDYEEEDDD 34 
GmGeBP8 . : PET LSPLVSWILSPSSSSSSSEEEEEEILDIITDNDINHENDQO 41 
voe pee E A E E AT E E E T ESDLNDAVFPEEDLD....DDDETP....EDEEEEEDDD. 32 
Consensus 

GmGeBRl — ..... EENVBSPSTA....LAVTVAV| Won eap E SDPÉRRRLELIEEKKP......... sss. 115 
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GmGeBP6 KTBLDPLKFPNANAEH ÜGSED...GGVANG. 294 
GmGeBP7 RBSSHHND. .TALEYD...QI SNVTPIGDNSLDD| 216 
GmGeBPB KRHRKETTTL..QSVVASLYDH ZIGIDT...DNII 216 
GmGeBP9 RBSSHHND. .TALEYD... KI SNTAPITGPVE 199 
Consensus de ek rrlk k 
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图 5 KE GeBP Æ HM & FJApST EE 


Fig.5 Multi-sequence comparison diagram of soybean GeBP proteins 


性 比较 低 ， 但 是 成 员 间 的 一 致 性 


通过 分 析 大 豆 GeBP 基因 家 族 成 员 之 间 的 氨基 酸 序列 的 一 致 性 发 现 , 尽管 整体 序列 一 臻 
E 还 是 有 比较 高 的 ，GmGeBPI 和 GmGeBP7 的 一 致 性 最 高 ， 


达到 了 90.2%， 其 次 是 GmGeBP3 和 GmGeBP9 的 88.5%， 接 着 是 GmGeBP4 和 GmGeBP8 
的 87.4%， 还 有 GmGeBP5 和 GmGeBP6 的 86.6%， 这 些 都 是 一 致 性 在 85% 以 上 的 序列 ， 同 


进化 树 的 分 析 结 果 也 相似 ,氨基 酸 序列 一 致 性 


高 ,表明 在 功能 上 这 些 基因 也 可 能 类 似 或 互补 。 


如 图 6 所 示 ， 大 豆 所 有 的 9 个 GmGeBP 成 员 都 包含 DUF573 结构 域 ， 属 于 DUF573 超 
家 族 。 尽 管 标注 为 未 知 功能 结构 域 ， 但 是 可 以 推测 该 部 分 在 GeBP 转录 因子 氨基 酸 序 列 中 很 


可 能 与 靶 标 基 


顺 式 作用 元 件 互 作 的 结构 域 ， 但 是 不 同 GmGeBP 中 DUF573 功能 结构 域 所 


处 的 位 置 存在 一 定 的 差异 ， 这 可 能 是 导致 不 同 GmGeBP 功能 差异 的 原因 之 一 。 
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图 6 大 豆 GeBP 蛋白 功能 结构 域 分 布 

Fig.6 Distribution of functional domains of GmGeBP proteins 
2.5 XX GeBP 基因 在 不 同 组 织 的 表达 分 析 

总 体 来 看 , 大豆 GmGeBP 家族 成 员 在 所 有 组 织 中 都 有 表达 , 其 中 GmGeBP4 和 GmGeBP8 

在 各 个 组 织 中 的 表达 量 相对 其 他 基因 都 普遍 偏 低 ( 图 7)。 单 个 基因 的 表达 情况 来 看 ， 
GmGeBP1 在 所 有 组 织 中 都 表达 ， 在 花 和 种 子 中 表达 量 最 高 ， 在 叶 、 结 节 、 莱 果 、 根 、 根 毛 、 
茎 尖 分 生 组 织 、 茎 表达 量 次 之 ; GmGeBP2 ÆI, H, KR WE HTF ERDER, 
茎 的 表达 比 在 花 和 根 中 表达 量 更 高 ，GmGeBP3 的 表达 主要 集中 在 花 器 官 中 ， 在 叶 、 结 节 、 
甘 果 、 根 、 根 毛 、 种 子 的 表达 中 次 之 ， 在 茎 尖 分 生 组 织 、 茎 的 表达 量 更 少 ，GmCeBP4 在 各 
组 织 中 表达 量 较 低 ;GmGeBP5 在 花 、 叶 、 结 节 、 荧 果 、 根 、 根 毛 、 种 子 、 苓 尖 分 生 组 织 、 
茎 中 均 表 达 ，GmGCeBP6 (Eit. Wp. ZW. SER. HR. HUE. BOT. ERDER, XB 
表达 ， 在 叶 和 根 毛 表达 量 最 高 ，GmGeBP7 Æ Wr. £i. ER TR. NUBE. BeT. XA 


分 生 组 织 、 茎 中 均 表 达 ， 在 花 、 叶 、 蔷 果 、 种 子 中 表达 最 高 ，GmGeBP8 在 花 中 表达 量 最 高 ， 
在 其 他 组 织 表 达 量 低 ;，GmGeBP9 在 花 、 叶 、 根 组 织 中 表达 量 高 ， 在 花 中 表达 量 最 高 。 
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7 GmGeBP 基因 在 不 同 组 织 的 表达 热 图 

Fig.7 Expression heat map of GmGeBP genes in different tissue s 
数据 分 析 结 果 表 明 , 同一 基因 在 不 同位 置 的 表达 量 不 一 样 , 同一 位 置 表达 所 对 应 的 基因 
表达 量 也 有 差异 ， 对 此 分 析 得 到 GmGeBP 家 族 成 员 的 表达 具有 一 定 的 特异 性 ， 且 各 成 员 之 
间 不 尽 相 同 ,因此 ,一 定 程度 上 基因 的 功能 取决 基因 在 不 同时 期 不 同 组 织 和 器 官 的 表达 情况 。 


3 讨论 与 结论 


对 植物 转录 因子 的 研究 ， 似 乎 更 偏向 于 参与 逆境 胁迫 反应 途径 相关 的 转录 因子 。 以 
WRKY 转录 因子 为 例 ，WRKY 转录 因子 是 植物 体 特 有 一 类 成 员 数 量 庞大 的 的 转录 因子 家 族 ， 
广泛 的 参与 到 植物 对 多 种 生物 和 非 生 物 胁迫 的 反应 过 程 (Jiang et al., 2017)， 是 当前 研究 最 热 
的 植物 转录 因子 之 一 。2020 4E 7 H 20 日 在 中 国 知 网 (https:/www.cnkinet/) 搜 索 篇 名 含有 
WRKY 的 文章 , 共 找 到 1512 条 结果 ,不仅 有 数量 众多 的 对 不 同 植物 种 类 WRKY 转录 因子 基 
因 家 族 的 全 基因 组 鉴定 和 分 析 ， 还 有 很 多 对 单个 WRKY 基因 相关 功能 的 研究 。 反 观 对 GeBP 
的 搜索 ， 只 找到 7 篇 文章 ， 植 物 只 涉及 拟 南 芥 、 水 稻 、 番 茄 和 毛竹 等 4 种， 尽管 最 早 关 于 
GeBP 基因 研究 的 文章 发 表 于 2003 年 (Curaba et al., 2003)， 但 是 这 十 几 年 来 对 GeBP 转录 因 
子 的 研究 还 是 非常 缓慢 ，GeBP 基因 的 很 多 功能 还 不 明确 。 

从 已 经 报道 的 结果 来 看 , 植物 GeBP 转录 因子 基因 家 族 成 员 数 量 不 是 很 多 ， 拟 南 芥 包含 
的 GeBP 成 员 最 多 ， 有 22 ^ (Chevalier et al., 2008); 毛竹 含有 16 个 成 员 ( 单 雪 萌 等 ，2020)， 
KEEA 15^ AUS. 2013), EWEA 10 个 成 员 ( 陈 凯 等 ，2019); 本 文 鉴 定 的 大 豆 的 
GeBP 成 员 更 少 ， 只 有 9 个 ( 表 1). GeBP 转录 因子 家 族 成 员 基 因 结 构 相 对 简单 ， 不 含有 内 含 
子 的 基因 所 占 比 例 很 高 。 毛 竹 有 13 个 成 员 没 有 内 含 子 ， 这 3 个 有 内 含 子 的 基因 ， 有 2 个 只 
有 1 个 内 含 子 ( 单 雪 萌 等 ，2020); PIA 8 个 成 员 没 有 内 含 子 ，2 个 有 内 含 子 的 基因 有 1 个 
只 有 1 个 内 含 子 ( 单 雪 彰 等 ， 2020); MAFA 16 个 成 员 没 有 内 含 子 ，6 个 有 内 含 子 的 基因 有 
4 个 只 有 1 个 内 含 子 (图 3); 大 豆 有 7 个 成 员 没 有 内 含 子 , 剩 下 有 内 含 子 的 2 个 基因 都 只 有 1 
个 内 含 子 (图 2)。 可 见 GeBP 转录 因子 家 族 基 因由 于 多 数 成 员 不 含 内 含 子 ， 在 转录 时 减少 了 
出 现 可 变 剪接 体 的 几率 ， 基 因 在 进化 时 就 更 加 的 稳定 和 保守 。 

在 进化 关系 上 ， 本 文 的 研究 结果 同 其 它 研究 类 似 ， 单 -双子 叶 植 物 之 间 各 自 的 进化 关系 
最 近 ， 同 时 都 有 一 个 分 支 为 双子 叶 植物 所 特有 ， 说 到 最 末端 分 文 ， 相 同 物种 间 的 家 族 成 员 的 
进化 关系 要 高 于 不 同 物种 间 的 进化 关系 ( 陈 凯 等 ，2019; 单 雪 萌 等 ，2020; 图 41)， 这 些 都 表 
明 GeBP 转录 因子 家 族 基 因 在 进化 上 的 保守 性 。 所 有 报道 的 和 本 文 的 GeBP 转录 因子 蛋白 都 
J DUF573 功能 结构 域 ( 陈 凯 等 ，2019; 单 雪 萌 等 ，2020; 图 6)， 尽 管 该 结构 域 的 功能 未 知 ， 
推测 该 功能 域 应 该 位 于 转录 因子 的 中 央 DNA 结合 区 ， 可 以 与 靶 基因 的 顺 式 作用 元 件 结合 调 
控 基 因 的 表达 , 但 是 因为 DUF573 功能 结构 域 在 转录 因子 上 的 位 置 不 同 , 所 以 在 调控 靶 基 因 
的 表达 上 也 存在 差异 。 

基因 的 表达 模式 同 基因 的 功能 是 紧密 相连 的 。 总 体 来 看 ， 不 同 物种 GeBP 转录 因子 基因 
在 各 自 物种 不 同 组 织 和 不 同 发 育 时 期 都 有 表达 ， 很 多 只 是 表达 强 弱 的 差异 ( 陈 凯 等 ，2019; 
单 雪 萌 等 ,2020; 图 7), 表明 GeBP 转录 因子 基因 在 不 同 组 织 和 不 同 发 育 时 期 都 发 挥 有 重要 
的 功能 。 对 毛竹 16 个 PeGeBPs 基因 的 表达 研究 发 现 ， 其 中 有 12 个 PeGeBPs 基因 在 带 有 表 
皮毛 的 叶 、 短 、 短 片 以 及 纤毛 中 的 表达 量 高 于 无 表皮 毛 的 笋 ， 表 明 它 们 在 表皮 毛 的 形成 中 应 
该 发 挥 了 主要 功能 ( 单 雪 萌 等 ，2020)。 表 皮毛 在 大 豆 植 株 上 的 分 布 位 于 叶片 、 茎 秆 、 豆 莱 和 
花 苯 等 地 上 部 器 官 表面 ， 结 合 GeBP 转录 因子 基因 调控 表皮 毛 生 长 发 育 的 功能 ，GmGeBP7 
fll GmGeBP6 是 研究 大 豆 调控 表皮 毛 生 长 发 育 的 最 住 候选 基因 。 

本 研究 通过 生物 信息 学 的 方法 ， 从 植物 转录 因子 数据 库 和 大 豆 基 因 组 搜寻 获得 9 个 
GeB5P 转 录 因 子 基 因 , 随后 对 家 族 成 员 基 因 的 核 苷 酸 序列 长 度 和 所 基 酸 序列 的 基本 理化 性 质 、 
基因 在 染色 体 的 物理 定位 、 基 因 结 构 、 系 统 进化 树 、 序 列 对 比 、 功 能 结构 域 分 布 、 基 因 在 不 
同 组 织 的 表达 模式 进行 综合 的 预测 和 分 析 , 研究 结果 将 为 进一步 深入 探究 大 豆 GeBP 转录 因 


子 基因 的 功能 机 制 提供 理论 依据 和 参考 价值 。 
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